No mundo da Geração Aumentada por Recuperação, muitas vezes somos vítimas do Paradoxo do Demonstrativo. Um protótipo pode parecer perfeito porque foi testado em um "caminho feliz" — um único PDF limpo e três perguntas selecionadas com cuidado. No entanto, um sistema utilizável não é construído com conquistas individuais como alta similaridade vetorial; nasce da integração da pipeline de nove estágios distintos trabalhando em conjunto.
O Erro dos Métricas Isoladas
Alta taxa de recall na recuperação é sem sentido se seu Estágio 1 (Ingestão) remover os metadados necessários para uma citação. Um MVP verdadeiramente integrado MVP requer um "loop fechado" onde as estratégias de divisão em blocos são explicitamente projetadas para alimentar as capacidades de raciocínio do gerador subsequente.
Observabilidade como Requisito
Passar para produção significa implementar uma profunda observabilidade em toda a arquitetura. Devemos monitorar a transição da pergunta até a evidência até a resposta, garantindo que o comportamento do sistema reflita a teoria de design, especialmente quando enfrentamos documentos reais desorganizados.